Claude Mythos 意外泄露:Anthropic 最强模型强到不敢发

前言

2026年3月27日,AI 圈迎来一场爆炸性消息——不是来自官方发布会,而是一场资料外泄事件。Anthropic(Claude 背后的公司)因为内容管理系统的配置失误,意外曝光了正在测试的最强新模型 Claude Mythos(代号 Capybara 🦫)。

这个模型在编程、推理、网络安全等方面全面碾压当前的顶配 Claude Opus 4.6,但 Anthropic 却迟迟不敢发布——因为它太强了,强到可能被黑客用于大规模网络攻击。


一、事件概述

(一)泄露经过

网络安全公司 LayerX Security 和剑桥大学研究人员发现,Anthropic 用于发布官博的内容管理系统(CMS)存在配置失误——所有上传的文件默认公开可访问

结果,近 3000 份内部文件被公开"晒"在互联网上,包括博客草稿、图片、PDF,甚至一份员工育儿假文件。

《财富》杂志意外检索到一篇带有完整结构的博客草稿,曝光了 Claude Mythos 的存在。

(二)事件核心

1
2
3
4
泄露来源:Anthropic 官方 CMS 配置失误
发现者:LayerX Security + 剑桥大学研究人员
泄露文件:约 3000 份
核心内容:Claude Mythos(代号 Capybara)模型已完成训练

二、Claude Mythos 是什么?

(一)全新顶配层级

目前 Anthropic 的模型分为三档:

层级 定位 代表模型
Opus 顶配 Claude Opus 4.6
Sonnet 中配 Claude Sonnet 4
Haiku 入门 Claude Haiku

Capybara(Mythos) 是一个全新的、比 Opus 更强的档位

“Capybara 是一个新的模型层级:比我们迄今最强的 Opus 系列更大、更智能——但同时也更贵。”

(二)命名玄机

“Capybara”(水豚🦫)打破了 Anthropic 传统的命名体系——Haiku、Sonnet、Opus 都是文学或音乐相关的词。这种刻意的断裂暗示:

这不是 Opus 的下一代,而是另一个层级的东西,不在原来的序列里。

(三)性能对比

能力维度 Claude Opus 4.6 Claude Mythos
软件编程 顶尖 ✅ 显著提升
学术推理 顶尖 ✅ 显著提升
网络安全 已能发现未知漏洞 🔴 远超任何模型
价格 最贵 更贵

三、为什么 Anthropic 不敢发布?

(一)网络安全能力过强

泄露文件指出:

“Mythos 在网络安全能力方面目前远超任何其他 AI 模型,它的存在预示着即将到来的一波 AI 模型浪潮,这些模型能够以远超防御方的速度发现和利用漏洞。”

换句话说:这个模型可能比现有的任何黑客工具都要厉害。

(二)攻击能力链

Mythos 在三个维度的提升,恰好构成完整的"攻击能力链":

1
2
3
4
5
6
7
编程能力 → 理解系统、编写利用代码

推理能力 → 规划攻击路径、绕过限制、逐步提权

网络安全能力 → 发现漏洞、"钻空子"

完整的网络攻击能力

(三)历史教训

Anthropic 曾披露,已有具备国家背景的黑客组织尝试利用 Claude 发起攻击。在一次事故中,对方借助 Claude Code 渗透了约 30 家机构(包括科技公司、金融机构和政府部门)。


四、Anthropic 的应对策略

(一)发布策略转变

以往大模型发布:先向开发者和普通用户开放,安全问题事后处理。

Mythos 发布策略:

1
先给网络安全防御机构 → 让他们提前加固系统 → 再考虑更广泛发布

这背后是一种相当直白的承认:这个模型对攻击方的潜在价值,可能大于对普通用户的价值。

(二)官方回应

Anthropic 在回应 Fortune 采访时确认:

“我们将这个模型视为一次**『阶跃式进化』**,是我们迄今构建的最强大的模型。”


五、更多爆料:高管闭门会

泄露文件还显示,Anthropic 将在英国举办闭门活动:

1
2
3
4
5
6
活动定位:小规模深度交流
目标人群:欧洲最具影响力的 CEO
出席人员:CEO Dario Amodei
活动内容:
├── 与政策制定者的圆桌讨论
└── 体验尚未发布的 Claude 新功能

六、行业背景

(一)AI 网络安全能力竞赛

公司 模型 网络安全能力
OpenAI GPT-5.3 Codex 首次标记为"高危能力"模型
Anthropic Claude Opus 4.6 能在真实代码库中发现未知漏洞
Anthropic Claude Mythos 🔴 远超以上所有模型

(二)IPO 时间线

据 The Information 消息,Anthropic 正在推进 IPO 计划,预计最快在今年第四季度上市


七、待确认信息

⚠️ 以下信息需要进一步核实

  • [ ] Mythos 和 Capybara 是否为同一模型
  • [ ] 具体发布时间
  • [ ] 定价策略
  • [ ] 早期访问客户名单
  • [ ] CMS 是如何被配置错误的

八、参考资料

  1. Fortune - Anthropic says it’s testing ‘Mythos,’ a powerful new AI model, after data leak reveals its existence
  2. 新智元 - 刚刚,Anthropic王炸Claude泄露!全面碾压Opus 4.6引爆全网
  3. DataLearner - 重磅!Anthropic官方数据泄露,正在测试新的大模型Claude Mythos
  4. AI前线 - Claude最新模型意外曝光:全面碾压Opus 4.6,强到让Anthropic不敢发布

总结

这次泄露事件暴露了一个事实:当模型能力逼近现实系统边界时,AI 公司需要面对的已经不只是"能不能做出来",而是"能不能安全地发布"。

Claude Mythos 的存在意味着 AI 模型的能力已经到达了一个新的临界点——强到连开发者自己都需要重新思考发布的节奏和方式。

关键看点:

  1. ✅ Claude Mythos 已完成训练,性能全面超越 Opus 4.6
  2. ✅ 网络安全能力过强,Anthropic 采取谨慎发布策略
  3. ✅ 命名"Capybara"暗示这是全新层级,非 Opus 继任者
  4. ⏳ 发布时间待定,可能先开放给网络安全防御机构

📌 本文基于公开泄露信息整理,部分细节可能随官方回应而更新。

整理时间:2026-03-28